Le écosystème de modélisation R est un cadre intégré où les structures de données, les fonctions mathématiques et les formules symboliques convergent pour traiter les modèles statistiques comme des objets de première classe. Contrairement aux langages procéduraux, R exploite les fonctions polymorphes pour relier théorie abstraite et exécution.
1. Conteneurs fondamentaux
L'écosystème repose sur le data.frame comme unité principale, organisant les structures hétérogènes vecteur et liste en formats rectangulaires requis pour l'analyse multivariée.
2. Formules symboliques
Le formula() interface (y ~ x) crée des liens symboliques entre les variables, soutenus par des transformations telles que log(), exp(), et choose() pour définir directement des fonctions de lien ou des a priori combinatoires.
3. Polymorphisme dans la visualisation
Le plot() fonction s’adapte selon la syntaxe d’entrée : plot(x, y) pour les diagrammes de dispersion, plot(df) pour les aperçus matriciels, et plot(y ~ expr) pour la visualisation conditionnelle basée sur des formules. L’évaluation initiale du modèle utilise souvent analyse de variance pour vérifier si les prédicteurs réduisent la déviance résiduelle avant inspection.